Indicadores de Calidad

INTRODUCCIÓN

El artículo 13 de la Norma para el Aseguramiento de la Calidad de la Información Estadística y Geográfica del Instituto Nacional de Estadística y Geografía (Norma) estipula que, para evaluar la calidad de la Información Estadística y Geográfica, las Unidades Administrativas, como mínimo, deberán calcular los indicadores de calidad y aplicar las metodologías de evaluación en los términos y periodicidad aprobados por el Comité. De acuerdo con el artículo 18 de la citada Norma, las Unidades Administrativas informarán al Comité los resultados de los indicadores y evaluaciones aplicados a los Procesos de Producción a su cargo, los cuales serán integrados en el Informe Anual de Resultados del Comité.

Considerando lo anterior y, para efectos de las atribuciones del Comité conforme al artículo 26 fracción IV de la Norma, se presenta la información del siguiente indicador de calidad.

1. MARCO DE REFERENCIA DEL INDICADOR

1.1 Nombre del indicador

Tasa de no respuesta antes de imputación a nivel unidad de observación.

1.2 Acuerdos del CoAC mediante los cuales fue aprobado el indicador:

Acuerdo CAC- 004/03/2017 en la tercera sesión del 2017 del Comité de Aseguramiento de la Calidad.

1.3 Fecha de inicio para reportar el indicador:

Para el caso de procesos de producción con muestreo probabilístico o no probabilístico, el cálculo y publicación estandarizada del indicador se aplicará a los procesos de producción incluidos en el calendario de difusión 2018, conforme a lo acordado por el Comité de Aseguramiento de la Calidad.

1.4 Principio de la Política de Calidad Institucional que mide el indicador:

Veracidad (precisión y confiabilidad)

1.5 Uso previsto del indicador:

El uso del indicador es combinado. De uso interno puede servir para la planeación de tareas operativas que permitan la reducción de la no respuesta y para analizar la conveniencia de usar métodos de imputación para presentar la información a publicar. De uso externo para tomar las precauciones necesarias al usar la información en caso de la presencia de patrones que pudieran indicar la existencia de un sesgo a causa de la no respuesta. La tasa de no respuesta se debe reportar a diferentes niveles de desagregación para que los usuarios de la información puedan estudiar la existencia del posible sesgo y, en caso de existir, tomar las precauciones necesarias al usar la información o bien usar metodologías que permitan mitigar el impacto.

Según el tipo de proceso de producción y unidad administrativa, se determinará su uso externo o interno para ciertos niveles de desagregación.

1.6 Fuentes de la metodología y/o estándares utilizados en el cálculo del indicador:

• Eurostat. ESS handbook for quality reports. 2014. Páginas 31‐79 y 124‐125.
• Office for National Statistics, UK. Guidelines for Measuring Statistical Output Quality. 2013. Página 28 y anexo A.
• United Nations Economic Commission for Europe (UNECE). Quality Indicators for the Generic Statistical Business Process Model (GSBPM) ‐ For Statistics derived from Surveys. 2016. Páginas 19, 21, 23, 24 y 48.
• Carl‐Erik Särndal et al. Model Assisted Survey Sampling, 2003. Capítulo 15.
• Carl‐Erik Särndal y Sixten Lundström. Estimation in surveys with nonresponse, 2005. En particular capítulos 5 y 9. .

1.7 Persona(s) participante(s) en la integración de la ficha del indicador:

Unidad Administrativa o Grupo de trabajo.- Grupo de trabajo para la definición de indicadores de precisión para encuestas.
Araceli Martínez Gama, directora de Marcos y Muestreo, Dirección General de Estadísticas Económicas.
Gonzalo Pérez de la Cruz, director en la Coordinación de asesores.
José de Jesús Jiménez Martínez, subdirector de Diseño Estadístico. Dirección General de Estadísticas Económicas.
Sofia Isabel Pérez Gutiérrez, jefa del departamento de Diseño Muestral de Encuestas Continuas. Dirección General de Estadísticas Económicas.
Mario Alberto Santillana Zapata, director general adjunto de Modelos de Información Gubernamental. Dirección General de Estadísticas de Gobierno, Seguridad Pública y Justicia.
Gerardo Barragán Romero, subdirector de Diseño Estadístico e Implementación de Encuestas Nacionales de Gobierno. Dirección General de Estadísticas de Gobierno, Seguridad Pública y Justicia.
Octavio Heredia Hernández, director general adjunto de Diseño y Marcos Estadísticos. Dirección General de Estadísticas Sociodemográficas.
Jaime Mojíca Cuevas, subdirector de Diseño Muestral de Vivienda. Dirección General de Estadísticas Sociodemográficas.
Noriki Armando Ibarra Medina, jefe del departamento de Selección y Control de Muestras Regulares, Dirección General de Estadísticas Sociodemográficas.
Fabián García Montaño, subdirector de Planeación, Análisis y Seguimiento. Dirección General de Geografía y Medio Ambiente.
Hortencia Medina Uribe, subdirectora de Estadísticas Ambientales en Actividades Económicas y Hogares. Dirección General de Geografía y Medio Ambiente.
Hugo Reginaldo Correa Bayardo, jefe del departamento de Análisis y Gestión del Subsistema. Vicepresidencia de Información Demográfica y Social.

1.8 Medios de difusión:

Difusión externa: Página Web del INEGI, según proceso y apartado de evaluación estadística de la calidad de los datos en la Red Nacional de Metadatos para cada proceso de producción.

1.9 Fecha de integración de la ficha:

20/10/2017. (Con base a la entrada en vigor de la NTPPIEG, se ajustaron algunos conceptos dentro de la ficha del indicador, los cuales no alteran en ningún sentido los aspectos técnicos del mismo; Dichos ajustes se aplicaron con fecha del 17/11/2021).

2. ESPECIFICACIONES TÉCNICAS DEL INDICADOR

2.1 Ámbito de aplicación:

Encuesta por muestreo mixto, encuesta probabilística y encuesta determinística (no probabilística).

2.2 Objetivo del indicador:

La no respuesta o existencia de valores perdidos está presente en todo proceso de producción de información estadística y geográfica y puede inducir un sesgo en las estimaciones o estadísticas que se generen a partir de la información. El objetivo principal de la tasa de no respuesta antes de imputación a nivel unidad de observación es tratar de identificar la existencia de patrones en la no respuesta que pudieran inducir ese sesgo, por lo tanto, la tasa de no respuesta se debe calcular y comparar sobre los diferentes dominios de estudio, variables más importantes usadas para la estratificación o sobre agrupaciones que pudieran estar relacionadas con las variables principales de los diferentes procesos de producción.

2.3 Periodicidad:

Se calculará según la frecuencia de levantamiento de información de cada proceso de producción.

2.4 Tiempo límite para el reporte del indicador:

Esta tasa se reportará al mismo tiempo que la publicación de la información de los procesos de producción.

2.5 Periodo de referencia o ámbito de aplicación:

El periodo de referencia es el periodo de levantamiento de la información.

2.6 Definiciones o conceptos relevantes:

Se deberán especificar los aspectos siguientes para cada proceso de producción:

i) La unidad de observación sobre la cual se realizará el cálculo de la tasa de no respuesta.

ii) Las agrupaciones sobre las cuales se calculará el indicador (principales dominios de estudio, variables de estratificación o agrupaciones relacionadas con las variables principales del proceso de producción).

El total de las unidades de observación cambia dependiendo del tipo de proceso de producción, por ejemplo, para procesos de producción con muestreo probabilístico son las unidades contenidas en la muestra seleccionada excluyendo aquellas que no pertenecen a la población objetivo del proceso de producción, mientras que para un muestreo no probabilístico puede ser el conjunto de unidades en donde se intentó recabar la información a partir de algún esquema no probabilístico excluyendo también aquellas que no pertenecen a la población objetivo del proceso de producción. En el caso del aprovechamiento de registros administrativos con fines estadísticos es posible que exista un listado que conforma el total de unidades de observación de las cuales se requiere la información, sin embargo, hay casos en donde el registro administrativo conforma por sí mismo ese total de unidades de observación ya que la población objetivo es igual a la población del registro administrativo.

2.7 Fórmula de cálculo:

Sea U el conjunto de todas las unidades de observación en donde se intentó recabar la información y que no están fuera de la población objetivo, definida para el proceso de producción.

Se define como información admisible a aquella información que pasa los criterios de validación, incluyendo los casos en donde desde la fase de diseño se definen como admisibles códigos de no respuesta para alguna variable en particular. Con esta definición se puede asignar a cada una de las unidades de observación contenidas en U en alguno de los tres subconjuntos siguientes:

U₁: El compuesto por aquellas unidades de observación en donde toda la información es admisible.
U₂: El compuesto por aquellas unidades de observación en donde no se obtuvo información alguna, por ejemplo, por cuestiones como inseguridad, unidad no disponible (se negaron a recibir al entrevistador, el informante no está disponible cuando se hace la visita), etc.
U₃: El compuesto por aquellas unidades de observación en donde se obtuvo información, pero al realizar la validación y codificación (en la fase de recolección o procesamiento del MPEG*) se decide que la unidad de observación tiene información no admisible en al menos una de las variables objeto del proceso de producción.

Para cada nivel de agregación g, g = 1,…,G, el número de unidades en U que pertenecen a g y al subconjunto U_i, i = 1,2,3; de donde el número de unidades de observación en U que pertenecen a g se obtiene como: N_g = N_g1 + N_g2 +N_g3.

La tasa de no respuesta antes de imputación a nivel unidad de observación para el nivel de agregación g, se define entonces como:
Fórmula

En el caso de muestreo probabilístico o de un muestreo no probabilístico basado en el tamaño de alguna variable de diseño, también se deberá calcular la versión ponderada de este indicador. En este caso se asume, sin pérdida de generalidad, que para cada agregación g las N_g unidades de observación en U que pertenecen a g tienen asociados los subíndices entre 1 y N_g, de manera que los primeros N_g1 corresponden a las unidades en U₁, los siguientes N_g2 a las unidades en U₂ y los últimos N_g3 a las unidades en U₃. Entonces, la versión ponderada de este indicador para el nivel de agregación g, TNR_wg se define como:
Fórmula

Donde:

i) en el caso de muestras probabilísticas, w_n corresponde al factor de expansión original de la unidad n que pertenece a g y,
ii) en el caso de muestras no probabilísticas, w_n = X_n, con X_n el valor de la variable de diseño X, usada en el esquema determinístico para obtener la muestra, asociado a la unidadn que pertenece a g.

2.8 Parámetro de interés

Porcentaje

2.9 Fuentes de información del indicador

Toda la información se obtiene del proceso de producción a evaluar.

Para el caso de muestreo no probabilístico la información para calcular la versión ponderada del indicador proviene del marco considerado como referencia en el proceso de producción.

2.10 Nivel de agregación

Las desagregaciones o agrupaciones sobre las cuales se calculará el indicador se definirán para cada proceso de producción en particular, pero al menos deben estar presentes los diferentes dominios de estudio de publicación.

2.11 Observaciones y/o especificaciones técnicas

La tasa de no respuesta antes de imputación a nivel unidad de observación se calcula considerando sólo el conjunto de todas las unidades de observación en donde se intenta recabar la información y que no se determinan fuera de la población objetivo, definida para el proceso de producción. En lo que sigue se hace referencia a las unidades de observación considerando sólo aquellas en este conjunto.

La tasa de no respuesta antes de imputación a nivel unidad de observación tiene como fin medir la no respuesta a nivel de unidad de observación, entendiendo ésta como aquella que se obtiene al considerar a las unidades de observación en donde no se obtuvo información alguna y a las unidades en donde la información de al menos una de las variables objeto del proceso de producción no tiene información admisible de acuerdo con la definición de la variable y los criterios de validación definidos en la fase de diseño para el proceso de producción en cuestión.

Se define como información admisible a aquella información que pasa los criterios de validación, incluyendo los casos en donde desde la fase de diseño se definen como admisibles códigos de no respuesta para alguna variable en particular. Es decir, esta no respuesta incluye:

i) Aquellas unidades de observación en donde se intentó recabar la información y no se obtuvo información alguna, por ejemplo, por cuestiones como inseguridad, unidad no disponible (se negaron a recibir al entrevistador, el informante no está disponible cuando se hace la visita), etc.

ii) Aquellas unidades de observación en donde se obtuvo información, pero al realizar la validación y codificación (en la fase de recolección o procesamiento del MPEG*) se decide que la unidad de observación tiene información no admisible en al menos una de las variables objeto del proceso de producción.

La tasa de no respuesta antes de imputación a nivel unidad de observación se define entonces como el cociente entre el total de las unidades de observación con las características definidas en los incisos i y ii y el total de las unidades de observación.

* De la fase de procesamiento sólo se considera la codificación y validación de la información de campo, todo procedimiento de imputación, edición y, en el caso de muestras probabilísticas, el ajuste de los factores de expansión no es parte de los procedimientos que se consideran para definir esta no respuesta. Por lo tanto, para el cálculo todos los insumos se deben tomar antes de aplicar cualquier algoritmo asociado a estas actividades.

El indicador se deberá publicar junto con los siguientes aspectos:

i) La unidad de observación sobre la cual se realizó el cálculo de la tasa de no respuesta.

ii) Las desagregaciones sobre las cuales se calculó el indicador (principales dominios de estudio, variables de estratificación o agrupaciones relacionadas con las variables principales del proceso de producción).

iii) Una nota de contexto en donde se haga énfasis de que no se observa una diferencia entre las tasas de no respuesta o bien indicando en donde se observa una discrepancia. Por ejemplo, "Considerando las tasas de no respuesta a nivel entidad federativa se observa que éstas varían entre 5% y 20% y resaltan las entidades X y Y con las tasas más altas de 18% y 20%, respectivamente".

2.12 Valores de referencia o estándar de calidad utilizado

No se adopta un valor de referencia, sin embargo, es deseable que no se supere el 15%. Lo más importante del cálculo de este indicador es informar al usuario sobre patrones observados al calcular el indicador en las agrupaciones definidas que pudieran sugerir la existencia de un sesgo por la no respuesta.